@InProceedings{RosaSant:2019:EsApDa,
author = "Rosa, Let{\'{\i}}cia da Silva and Santos, Rafael Duarte Coelho
dos",
affiliation = "{Universidade Paulista (UNIP)} and {Instituto Nacional de
Pesquisas Espaciais (INPE)}",
title = "Estudos aplicados {\`a} data science com foco em dados
p{\'u}blicos",
booktitle = "Anais...",
year = "2019",
editor = "Santos, Rafael Duarte Coelho Dos and Mattos, Ariane Frassoni Dos
Santos De and Mello, Carina Barros and Queiroz, Gilberto Ribeiro
De and Vasconcelos, Leandro Guarino De and Vieira, Luis Eduardo
Antunes and Forti, Maria Cristina and Gatto, Rubens Cruz",
organization = "Semin{\'a}rio de Inicia{\c{c}}{\~a}o Cient{\'{\i}}fica e
Inicia{\c{c}}{\~a}o em Desenvolvimento Tecnol{\'o}gico e
Inova{\c{c}}{\~a}o (SICINPE)",
publisher = "Instituto Nacional de Pesquisas Espaciais (INPE)",
address = "S{\~a}o Jos{\'e} dos Campos",
note = "{Bolsa PIBIC/INPE/CNPq}",
keywords = "data science.",
abstract = "Este trabalho, iniciado em agosto de 2018, tem como objetivo o
aprendizado e aprofundamento em t{\'e}cnicas utilizadas na
{\'a}rea de Ci{\^e}ncia de Dados, para sua aplica{\c{c}}{\~a}o
em projetos que possuam a necessidade de obter
informa{\c{c}}{\~o}es contidas em espa{\c{c}}os n{\~a}o
t{\~a}o claros para sua captura. Dona de um crescimento
not{\'o}rio nos {\'u}ltimos anos, a {\'a}rea de Data Science
vem ganhando espa{\c{c}}o devido a grande quantidade de dados
existentes, dos quais podem ser extra{\'{\i}}das
informa{\c{c}}{\~o}es para diversas frentes. Uma delas {\'e} a
dos Dados P{\'u}blicos, que ganhou visibilidade a partir da Lei
de Acesso {\`a} Informa{\c{c}}{\~a}o, em vigor desde 2012. Ela
regulamenta que informa{\c{c}}{\~o}es p{\'u}blicas dos
{\'o}rg{\~a}os e entidades do governo, em todas suas esferas,
sejam recebidas por pessoas f{\'{\i}}sicas ou
jur{\'{\i}}dicas. Com base nos fatos apontados, um projeto foi
desenvolvido utilizando a plataforma do DATASUS, onde dados de
mortalidade dos desastres clim{\'a}ticos mais importantes do
Brasil foram extra{\'{\i}}dos e analisados. O trabalho mostra as
dificuldades enfrentadas desde a obten{\c{c}}{\~a}o at{\'e} a
manipula{\c{c}}{\~a}o dos dados, de que maneira que eles foram
disponibilizados, qual foi o impacto gerado no produto e o que
pode ser extra{\'{\i}}do dessa experi{\^e}ncia. O projeto conta
com a participa{\c{c}}{\~a}o de um trabalho de doutorado que deu
origem a tem{\'a}tica dos dados extra{\'{\i}}dos, da doutoranda
Gabriela Couto, cujo foco {\'e} analisar os dez maiores desastres
clim{\'a}ticos ocorridos na hist{\'o}ria brasileira atrav{\'e}s
das lentes do g{\^e}nero. Isso possibilitou o desenvolvimento de
um olhar mais apurado para as situa{\c{c}}{\~o}es evidenciadas e
os respectivos resultados apresentados. Ferramentas como as
linguagens Python, R e SQL, notebooks, e conceitos de Web Scraping
e Data Mining foram utilizadas para o estudo. Devido {\`a}s
variadas formas que o dado foi encontrado, {\'e}
poss{\'{\i}}vel notar os desafios apresentados para os
profissional da {\'a}rea, que n{\~a}o {\'e} capaz de prever
qual ser{\'a} o cen{\'a}rio encontrado para a
extra{\c{c}}{\~a}o das informa{\c{c}}{\~o}es necess{\'a}rias.
Espera-se dar continuidade ao projeto de forma a proporcionar
maior embasamento na {\'a}rea, possibilitando que novas vertentes
venham a ser trabalhadas e que processos de an{\'a}lise,
automatiza{\c{c}}{\~a}o e extra{\c{c}}{\~a}o dos dados sejam
implantados e melhorados.",
conference-location = "S{\~a}o Jos{\'e} dos Campos",
conference-year = "12-13 ago. 2019",
language = "pt",
organisation = "Instituto Nacional de Pesquisas Espaciais (INPE)",
ibi = "8JMKD3MGPDW34R/3U5US6S",
url = "http://urlib.net/ibi/8JMKD3MGPDW34R/3U5US6S",
targetfile = "2019 LETICIA SILVA.pdf",
type = "COMP",
urlaccessdate = "27 abr. 2024"
}